基于 大 语言 模型 的 中 庸 思维 对 心理 健康 的 影响 机 制 研究 一 一 道德 中 


摘要 近年 来 , f 
的 作用 机 
表 “ 利 他 ”的 共生 动机 
系统 的 平衡 状况 ， 其 
德 中 心性 或 许 在 中 局 
心性 的 测量 存在 较为 成 熟 的 评估 方法 


心性 的 中 介 作 用 


E) Be 12 朱 廷 动 12* 
1 (中 国 科 学 院 心 理 研究 所 , 北京 100101) 


2 (1 


究 者 们 


f IK AÍ 


FF 


思维 对 心理 


TH 


对 个 人 奋斗 文本 的 价值 观 编码 工 


年 大 型 语言 模型 (比如 ChatGPT) 
域 的 文本 分 析 和 编码 工作 提供 了 兽 


本 ， 同 时 探究 ， 
影响 个 体 心 到 


其 应 用 于 心理 学 研究 编码 工作 ， 


EEZ 


研究 结果 如 下 


动机 ， 增 强 


准确 率 不 低 于 0.80， 展 现 了 ChatGPT 在 心 
思维 对 抑郁 /焦虑 的 影响 中 起 到 了 中 介 作 用 ， 高 中 庸 思 维 的 个 体能 遇 


道德 中 心性 ， 从 而 降低 个 体 


言 模型 技术 突破 了 传统 心理 学 研究 技术 上 的 限制 ， 探 究 了 : 
心性 在 其 中 起 到 的 中 介 作 用 。 一 方面 证 明了 大 型 语 


验证 了 道德 ! 


已 较为 一 致 地 认识 到 中 局 
+ 明晰。 以 往 研究 3 


国 科 学 院 大 学 , 北京 10049) 


影响 中 发 挥 了 潜在 ， 


对 心理 健康 的 影响 机 
健康 水 平 。 研 究 一 通过 提示 了 


个 人 奋斗 中 包含 的 价值 观 〔 成 就 /权力 /博爱 /仁爱 )， 六 


评估 ， 以 得 到 符合 要 求 、 满 足 应 
心性 的 测量 中 ， 验 证 道德 中 心性 在 中 庸 思 维 对 心理 健康 〈 抑 有 
: (1) GPT-3.5 Turbo 大 型 语言 模型 在 识别 权力 、 
理学 研究 中 的 应 用 潜力 ; 


低 个 体 道 德 中 心性 测量 过 程 中 月 


RR 明 ， 当 个 体能 较 好 地 协调 代表 “ 
时， 就 会 拥有 相对 高 的 道德 中 心性 水 平 。 道 德 ， 


望 借助 大 型 


j 条 件 的 识别 模型 。 在 研究 


~ 


的 应 用 潜力 ， 
的 理论 基 耐 


H 
zm f BORSE 


良性 发 展 。 


ERAH 


关键 词 道德 


心性 ， 心 到 


上 定 者 ， 可 以 尝试 发 挥 中 庸 文化 从 


的 价值 观 ， 帮 助 民 众 


和 思维 对 心理 健康 的 积极 影响 ， 然 而 其 潜在 
利己 ”的 能 动 动 机 和 代 
心性 体现 了 内 部 动机 
动机 之 间 的 冲突 ， 促 使 两 种 动机 相互 文 持 、 相 互 激励 。 道 
介 作 用 。 当 前 对 于 个 体 道德 中 
Values Embeddedin Narratives(VEIN)， 但 其 涉及 到 
此 测量 过 程 较 为 复杂 且 人 力 成 本 较 高 。 然 而 ， 近 几 
的 发 展 显 示 出 了 其 卓越 的 上 下 文 到 
的 可 能 性 。 本 研究 


解 能 力 ， 为 心理 学 领 


语言 模型 前 沿 技术 ， 将 


「 需 要 的 时 间 以 及 人 力 成 
判 ， 了 解 文 化 是 如 何 通过 影响 道德 中 心性 进而 
[ 程 设计 差异 化 提示 词 来 训 
对 识别 准确 率 、 精 确 率 和 召 


练 GPT-3.5 Turbo 识别 


回 率 进行 


中 将 


上 述 模型 应 


摆 也 加 深 了 我 们 对 文化 因素 影响 心理 健康 机 


ES 


I Id 维 对 4 Ù H 


FP 和 焦虑 ) 影响 中 的 中 介 作 
it、 博 爱 和 仁爱 价值 观 | 
心性 在 中 月 
有 效 地 整合 能 动 与 共 4 
的 抑郁 /焦虑 水 平 。 综 上 所 述 ， 本 研究 利用 大 型 


(2) 道德 


A 


r1 


ITS B 


TT 


eT 


di 


mT 


iH 


影响 机 第 


r= 
=< 
~ 


模型 在 心理 学 研究 领 


HER, PJE) 


思维 ， 大 型 语言 模型 


fti] 


的 认识 ， 丰 富 
势 ， 倡 导 重 视 个 人 发 展 同时 注 


Y 
SS 


Y 
2b 


了 该 领 


成 协调 的 思维 模式 ， 维 护 和 促进 人民 精 神 健 月 


与 社会 的 


The Impact of Zhong-yong Thinking Style on Mental Health using LLM: The Mediating Role 
of Moral Centrality 


Abstract In recent years, researchers have recognized the impact of Zhong-yong Thinking Style on 
mental health. However, it is not clear how Zhong-yong thinking style affects mental health through 
internal psychological mechanisms. Previous studies found that individuals with a better ability to 
coordinate agency (a motivation representing self-interest) and communion (a motivation 
representing altruism) tend to have a higher level of moral centrality. Moral centrality reflects the 
balance of internal motivation system, which can reduce the conflict between agency and 
communion, helping individuals reach a state that the opposing motivations support and energies 
each other. Moral centrality may play a potential mediating role in the impact of Zhong-yong 
thinking style on mental health. Although there are relatively mature methods for measuring 
individual moral centrality, it involves the complex task of coding values in personal strivings, 
making the measurement of moral centrality particularly complicated and labor-intensive. However, 
with the development of large language models(LLM) like ChatGPT, they have demonstrated 
excellent contextual comprehension skills and offered new possibilities for text analysis and coding 
work. Accordingly, this study intends to apply large language models to the coding work of 
psychological research, reduce the time and labor cost required in the process of measuring 
individual moral centrality, and explore how Zhong-yong thinking style affects individual mental 
health through moral centrality. Study 1 involves training GPT-3.5 Turbo to recognize values 
contained in personal strivings (achievement / power / universalism / benevolence) using 
differentiated prompts and evaluating its accuracy, precision, and recall rates, in order to obtain a 
model that meets the requirements for application. Study 2 applies above GPT-3.5 Turbo models in 
the process of measuring moral centrality, exploring how moral centrality mediates the impact of 
Zhong-yong thinking style on depression and anxiety. The findings are as follows: (1) The GPT-3.5 
Turbo demonstrated an accuracy rate of not less than 0.80 in recognizing values of power, 
achievement, universlaism, and benevolence, showing the potential application of ChatGPT in 
psychological research; (2) Moral centrality played a mediating role in the impact of Zhong-yong 
thinking style on depression/anxiety. Specifically, individuals with a higher level of Zhong-yong 
thinking style could better integrate agency and communion, enhancing their moral centrality, and 
thereby reducing levels of depression/anxiety. In summary, this study utilized large language models 
to break through the technical limitations of traditional psychological research, exploring the 
mechanisms through which Zhong-yong thinking style affects mental health and verifying the 
mediating role of moral centrality. On the one hand, it proves the application potential of large 
language models in the field of psychological research. On the other hand, it deepens our 
understanding of the mechanisms through which Zhong-yong thinking style influence mental health, 
enriching the theoretical foundation of this field. It suggests that policymakers could use the 
advantages of Zhongyong thinking culture, advocating for values that emphasize individual 
development while also focusing on collective well-being, helping people improve moral centrality, 
thereby mitigating the negative impact of economic inequality on mental health. 


Keywords Moral Centrality, Mental Health, Zhong-yong Thinking Style, Large Language Models 
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中 国 传统 哲学 中 的 重要 思想 流派 之 一 是 儒家 的 中 庸 思 想 ( 王 天 川 , 2007)， 中 庸 作为 中 国 
的 传统 文化 之 一 ， 也 在 潜移默化 间 成 为 中 国人 的 一 大 典型 思维 特征 。 中 庸 思 维 强调 多 方位 
考虑 问题 , 避免 走 极端 , 合理 行事 , 保持 人 际 和 谐 的 思维 方式 Ji 等 , 2010)。 吴 佳 辉 和 林 以 正 
(2005) 根 据 中 庸 思 维 的 特色 ， 将 中 良 思 维 定义 为 由 多 个 角度 来 思考 同一 件 事情 ， 在 详细 地 
考虑 不 同 看 法 之 后 ， 选 择 可 以 顾全 自我 与 大 局 的 行为 方式 。 

中 庸 思维 可 以 提升 人 们 在 处 理 生活 中 的 复杂 性 和 了 矛盾 性 时 所 展现 出 的 平衡 和 综合 能 力 ， 
对 个 体 心理 健康 状态 具有 显著 积极 影响 。 理 论 上 来 说 ， 中 庸 的 思维 方式 鼓励 人 们 接受 自己 
内 部 对 立 特征 、 情 绪 和 态度 的 共存 ， 从 而 使 压力 更 容易 忍受 ， 积 极 情绪 和 消极 情绪 更 容易 
kt 存 ， 情 绪 复 杂 性 的 体验 更 舒适 (Goetz 等 , 2008)。 中 良 思 维 还 强调 接受 和 改变 之 间 的 平衡 
和 综合 ， 与 处 理 情绪 问题 时 常用 的 辩证 行为 疗法 (Dialectical Behavior Therapy, DBT) 在 理论 
基础 和 训练 实践 上 有 较 多 相似 之 处 (Lynch 等 , 2006; M. Linehan, Henry Schmidt, Linda A., 
1999)。 实 证 研究 上 来 看 ， 研 究 者 们 也 较为 一 致 地 发 现 中 庸 思维 水 平 与 一 些 积极 心理 健康 指 
标 〈 如 主观 幸福 感 、 自 尊 、 心 理 弹 性 、 生 活 满意 度 、 人 际 关系 能 力 ) 呈正 相关 ， 与 一 些 负 
面 心理 健康 指标 〈 如 焦虑 、 抑 郁 、 边 缘 人 格 特质 ) 呈 负 相关 (An & Lee, 2019; Yang 等 , 2016; 
Hou et al., 2020; He & Li, 2021; Cui 等 , 2022)。 除 此 之 外 ， 中 良 思 维 在 心理 治疗 领域 的 应 用 
也 被 发 现 能 有 效 缓解 个 体 抑郁 症状 ， 强 化 辨证 行为 疗法 的 疗效 ， 降 低 高 自杀 风险 群体 的 自 
杀 意 念 、 绝 望 感 、 心 理 疼痛 症状 以 及 一 般 精神 病理 水 平 (Yang et al., 2016)。 但 是 迄今 为 止 
鲜 少 有 研究 者 对 其 内 在 的 作用 机 制 进行 探讨 ， 使 得 我 们 对 于 中 庸 思维 如 何 能 够 缓解 个 体 抑 
郁 、 焦 虑 水 平 的 作用 机 制 还 知之 甚 少 。 
根据 Bronfenbrenner (2000) 提出 的 生态 系统 理论 (Ecological Systems Theory)， 处 于 不 
同文 化 背景 环境 的 个 体 ， 其 在 价值 观 与 动机 取向 上 也 可 能 表现 出 差异 。Schwartz(1992) 基 于 
对 不 同 国家 和 文化 背景 下 成 千 上 万 人 的 调查 指出 人 类 价值 观 可 以 被 分 为 10 种 基本 类 型 ， 这 
些 类 型 又 根据 其 动机 目标 可 以 分 为 自我 超越 CSelf-transcendence) 、 自 我 提升 〈Self- 
enhancement)、 保 守 〈Conservation)、 对 变化 的 开放 性 态度 (Openness to Change) 4 个 维度 。 
Frimer 等 人 (2011) 认 为 自我 提高 可 以 被 视 作为 一 种 能 动 (Agency) 动机 ， 因 为 它 侧重 自身 
利益 ， 强 调 通 过 权力 、 控 制 等 方式 追求 自身 独立 和 提升 ， 涉 及 成 就 、 竞 争 等 主题 ， 而 自我 
超越 则 可 以 被 视 为 一 种 共生 (Communion) 动机 ， 因 为 它 侧重 于 促进 他 人 利益 ， 以 关心 他 
人 和 贡献 社会 为 主题 ， 涉 及 仁爱 、 依 恋 和 同 理 心 等 品质 。Frimer 和 Walker (2009) 指 出 当 人 
们 能 够 协调 代表 自身 的 能 动 动机 和 代表 他 人 利益 的 共生 动机 时 ， 该 个 体 便 实 现 了 道德 中 心 
性 ， 具 有 道德 中 心性 的 个 体会 认为 在 实践 代表 他 人 利益 的 道德 行为 时 ， 自 身 的 利益 也 得 到 
了 实现 ， 是 能 动 动机 和 共生 动机 的 高 度 整 合 。 
中 庸 之 道 ， 作 为 儒家 文化 中 的 核心 理念 ， 被 认为 是 中 国文 化 中 最 具 影 响 力 的 思维 模式 
(Chang & Yang, 2014)， 亦 被 视 为 中 国人 在 人 际 交往 中 推崇 的 行动 方式 (Yao et al., 2010)， 或 
许 为 个 体 提 供 了 在 能 动 动机 和 共生 动机 之 间 寻 找平 衡 的 思维 框架 。 根 据 吴 佳 辉 和 林 以 正 
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(2005) 的 理论 ， 中 庸 思维 包含 三 个 特征 : 多 元 思考 、 整 体 观念 以 及 和 谐 性 。 其 中 ， 多 元 思 
考 要 求 个 体 在 表达 观点 时 从 多 个 角度 进行 思考 ， 即 在 做 出 决策 前 考虑 多 种 可 
念 衡量 的 是 将 外 部 信息 和 内 部 需求 作为 一 个 整体 进行 整合 的 程度 ， 和 谐 性 评估 的 是 在 处 理 
人 际 冲突 时 的 和 谐 行事 倾向 。 中 庸 思 维 ， 通 过 其 多 元 思考 、 整 体 观念 和 和 谐 性 的 特点 ， 帮 


能 性 ， 整 体 观 


助 个 体 的 能 动 动机 《代表 自身 利益 ) 与 共生 动机 代表 他 人 利益 ) 之 间 实 现 协调 和 平衡 ， 


从 而 提高 个 体 的 道德 中 心性 。 比 如 ， 研 究 者 们 发 现 具有 高 水 平 中 庸 思 维 的 个 体会 避免 极端 


行为 ， 并 根据 情境 的 具体 需求 和 个 人 的 内 在 期 望 表 现 出 适当 的 行为 Peng & 
Zhou 等 , 2019)。 


Nisbett, 1999; 


以 往 研究 发 现 ， 能 动 动机 与 共生 动机 之 间 的 平衡 状况 对 个 体 的 心理 健康 有 显著 影响 。 


Frimer 和 Walker(2009) 认 为 认为 道德 中 心性 的 发 展会 减少 个 体内 部 动机 系统 的 不 平衡 ， 能 
动 可 以 为 共生 “注入 生命 ”， 而 共生 则 赋予 了 能 动 更 大 的 目标 。 两 种 动机 之 间 的 平衡 和 协调 
能 相互 支持 ， 相 互 激励 。 共 生 能 够 激发 能 动 ， 而 能 动 以 一 种 增强 社会 关系 的 方式 发 挥 作用 ， 


进而 产生 更 多 的 能 动 性 。 因 此 ， 有 具有 道德 中 心性 的 个 体能 够 以 最 小 的 精力 为 代价 来 帮助 个 
体 实 现 自己 的 价值 ， 通 过 意义 体验 来 获得 积极 的 感受 ， 提 升 幸福 感 ， 降 低 被 消极 情绪 《如 


焦虑 、 抑 郁 ) 干扰 的 可 能 性 。 实 证 研究 的 结果 印证 了 他 们 的 假设 ， 个 体 在 自我 叙述 中 体现 
的 道德 中 心性 被 发 现 与 幸福 感 和 自尊 正 相 关 ， 而 与 消极 情绪 、 焦 虑 和 抑郁 呈现 负 相 关 ， 且 


在 纳入 利他 主义 后 ， 这 些 关 系 依然 成 立 (Hoyda, 2023). Helgeson 和 Fritz (2000) 认 为 当 能 动 


动机 与 共生 动机 失衡 时 ， 便 会 出 现 极端 的 能 动 Cunmitigated agency) 与 极端 的 共生 
(unmitigated communion)。 极 端的 能 动 被 描述 为 自我 中 心 ( 即 傲慢 和 自我 中 心 ) 和 对 他 人 


有 负面 看 法 〈 即 慎 世 嫉 众 和 充满 敌意 )， 极端 的 共生 则 代表 全 神 贯 注 于 他 人 的 想法 和 行为 ， 


进而 导致 对 自我 的 忽视 (Helgeson & Fritz, 2000)。 极 端的 能 动 和 极端 的 共生 都 已 经 被 发 现 会 
负 向 影响 个 体 的 精神 健康 ， 与 个 体 的 焦虑 和 抑郁 情绪 呈正 相关 关系 (Bruch, 2002; Helgeson & 


Fritz, 1998)。 


综 上 ， 我 们 可 以 看 出 道德 中 心性 或 许 在 中 庸 思维 对 心理 健康 的 影响 中 起 到 了 中 介 作 用 


具有 更 高 中 庸 思维 的 个 体 或 许 能 够 更 好 地 平衡 能 动 动机 与 共生 动机 ， 拥 有 更 高 的 道德 中 心 


性 ， 进 而 提升 个 体 的 心理 健康 水 平 。Frimer 和 Walker(2009) 开 发 并 验证 了 首 个 关于 个 体 道德 


中 心性 的 实证 测量 方法 一 一 Values Embedded in Narrative (VEIN)。 其 中 较为 简便 的 方式 则 是 
通过 让 被 试 撰写 个 人 奋斗 列表 收集 个 体 的 个 人 叙事 ， 再 根据 VEIN 手册 对 个 人 倒 事 材料 进 
行 成 就 /权力 /博爱 /仁爱 价值 观 编码 ， 根 据 编码 结果 计算 个 体 的 道德 中 心性 水 平 。 虽 然 个 人 
奋斗 列表 已 经 在 一 定 程度 上 提供 了 一 种 更 为 简洁 、 方 便 的 方式 来 测量 个 体 的 道德 中 心性 ， 


但 是 因为 过 程 中 涉及 到 对 个 人 奋斗 文本 的 价值 观 编码 工作 ， 因 此 测量 过 程 较为 复杂 且 人 力 


成 本 较 高 。 


解 和 生成 自然 语言 文本 的 大 型 语言 模型 ， 在 包括 心理 学 的 众多 领域 显示 出 了 


随 着 近 几 年 大 型 语言 模型 的 迅速 发 展 ，OpenAI 开发 的 ChatGPT 作为 一 个 专门 用 于 理 


巨大 的 潜力 和 


广泛 的 应 用 价值 。ChatGPT 属于 GPT (Generative Pre-trained Transformer) 系列 模型 ， 通 过 


大 量 互 联网 文本 数据 集 (e.g., Common Crawl, Wikipedia) 上 的 预 训练 赋予 了 ChatGPT 强大 
的 语言 处 理 能 力 ， 使 其 能 够 理解 和 生成 各 种 语言 的 文本 ， 从 而 适用 于 路 语言 和 路 文化 的 文 


出 了 不 错 的 性 能 , 体现 了 ChatGPT 在 文本 分 类 任务 ! 


本 分 析 任 务 。ChatGPT 在 隐形 仇恨 言论 检测 与 解释 (Huang 
(Kuzman et al., 2023)、 主 题 分 析 (Gilardi et al., 2023)、 情 感 识 别 (Sudirjo et al., 2023) 中 都 表现 


言 上 下 文 有 较 强 的 理解 能 力 ， 其 或 许 能 帮助 我 们 准确 且 快 速 


et al., 2023)， 文 本 体裁 识别 


广泛 的 应 用 前 景 。 综 上 ，ChatGPT 对 语 
捉 个 人 奋斗 文本 中 隐 伟 的 价 


值 取向 ; 最 重要 的 是 ， 与 人 工 标注 相 比 ，ChatGPT 可 以 更 快速 地 处 理 大 量 文 本 数据 ， 在 较 


短 时 间 耗 费 较 少 的 人 力 成 本 就 能 完成 价值 观 标注 任务 。 这 为 本 研究 通过 提示 工程 ， 设 计 并 


优化 提示 词 来 训练 ChatGPT 完成 个 人 奋斗 中 的 价值 观 识 别 任务 提供 了 现实 价值 与 可 能 性 。 
本 研究 将 分 为 两 个 子 研究 ， 研 究 一 尝试 训练 ChatGPT 来 完成 个 人 奋斗 列表 的 价值 观 编 


码 工作 。 具 体 来 说 ， 研 究 一 基于 VEIN 手册 中 提供 的 价值 观 定 义 及 其 行为 倾向 ， 
个 价值 观 〈 成 就 /权力 /博爱 /仁爱 )， 设 计 并 优化 对 应 的 提示 词 ， 训 练 ChatGPT 对 
中 提供 的 已 编码 样 例 进行 识别 ， 判 定 某 一 价值 观 是 否 存在 于 某 条 个 人 奋斗 中 ， 判 定 完成 后 


构建 混 消 矩 阵 评 估 模 型 识别 效果 ， 针 对 每 个 价值 观 获 
同时 考察 不 同 提示 技术 对 价值 观 识 别 效果 的 影响 ， 验 证 大 型 语言 模型 处 理 复杂 文本 数据 的 
潜力 ， 弥 补 传统 人 工 标注 方法 费时 费力 的 问题 。 


| VEIN 手册 


针对 每 一 


得 符合 应 用 标准 的 价值 观 识别 模型 ， 


庸 思维 对 个 体 抑 郁 / 焦 虑 水平 的 影响 关系 ， 以 及 道德 中 心性 在 其 中 的 中 介 作 月 


在 研究 二 


中 ， 我 们 将 通过 实证 研究 验证 ! 


Ho 需要 关注 的 


是 ， 与 以 往 研究 不 同 ， 在 测量 与 计算 个 体 道德 中 心性 的 过 程 中 ， 我 们 创新 性 地 运用 研究 
训练 的 大 型 语言 模型 来 识别 被 试 撰写 的 个 人 奋斗 中 所 包含 的 价值 观 ， 而 非 采取 人 工 标 注 的 
素 通过 道德 中 心性 这 一 路 径 作用 


方法 。 通 过 上 述 两 个 研究 ， 我 们 希望 能 进一步 揭示 文化 因 
于 个 体 心 理 健 康 的 潜在 机 制 ， 展 示 大 型 语言 模型 在 心理 


tH 


p 


的 技术 手段 和 研究 思路 。 


2 研究 一 基于 GPT3.5-Turbo 对 共生 /能 动 动机 的 识别 研究 


2.1 研究 方法 


提示 词 要 素 分 为 指令 、 上 下 文 、 输 入 数据 和 输 
对 识别 效果 的 影响 ， 本 研究 中 同一 个 价值 观 的 识别 模型 在 指令 、 


理解 和 干预 个 体 心 理 健康 问题 提供 了 新 的 视角 和 方法 ， 同 时 也 为 心理 


学 研究 中 的 应 用 潜力 。 这 些 研究 为 
学 研究 领域 引入 了 新 


指示， 为 了 更 好 地 评估 不 同 提示 技术 
输入 数据 、 输 日 


指示 要 素 


上 皆 保 持 一 致 ， 通 过 引入 不 同 的 提示 技术 〈 零 样本 、 少 样本 、 角 色 扮 演 ) 形成 不 同 的 上 下 


文 ， 对 同一 批 已 标注 样 例 进 行 识别 ， 在 此 基础 上 


评估 模型 性 能 ， 选 择 更 1。 


ChatGPT 的 跨 语言 处 理 能 力 ， 本 文 沿 用 VEIN 手 


模型 。 鉴 于 


册 中 关于 价值 观 的 英文 定义 及 其 包含 标准 ， 


以 避免 在 将 这 些 内 容 翻 译 成 中 文 时 可 能 出 现 的 不 同文 化 环境 下 的 语义 偏差 。 


由 于 我 们 使 用 等 量 的 正 例 和 反例 提供 给 模型 进行 识别 ， 基 于 VEIN 手册 
一 致 性 系数 的 要 求 〈Cohen's kappa>0.6)， 当 模型 在 特定 实验 条 件 下 的 准 古 


对 于 编码 者 
角 率 达到 或 超过 0.8 


时 ， 我 们 便 可 认为 该 模型 的 识别 效果 符合 要 求 ， 


可 以 用 了 


后 续 的 应 用 场景 。 本 而 


究 将 以 权 


力 价值 观 作为 主要 观察 对 象 ， 通 过 设 


置 表 2-1 中 的 实验 条 件 ， 系 统 地 考察 样本 数量 、 正 反 


样本 比例 、 是 否 运用 角色 扮演 这 三 个 变量 对 权力 价值 观 识 别 效果 的 影响 。 针 对 成 就 、 博 爱 


和 仁爱 价值 观 ， 当 模型 效果 足够 应 用 于 后 续 场景 时 《〈 即 准确 率 > 0.8)， 则 停止 实验 。 


表 2-1 GPT3.5-Turbo 价值 观 识 别 模型 训练 实验 条 件 


实验 变量 实验 条 件 RH aanes 
aL Ed. ERX 《价值 观 定义 + 包含 标 准 )、 输 入 内 容 、 输 
Te 出 格式 
peo 指令 、 上 下 文 《 价 值 观 定义 + 包含 标准 16 个 正 例 ) 输入 
re (00 We MER 
pue, PO ETE (价值 观 定义 + 包 售 标 准 +6 个 负 例 )、 输 入 
内 容 、 输 出 格式 
指令 、 上 下 文 《价值 观 定义 + 包含 标准 +6 个 正 例 +6 个 负 
MEAG 网 )、 输 入 内 容 、 输 出 格式 
- ES. EP MEEN AEs 个 正 例 16 个 负 
PESTS) 网 )、 输 入 内 容 、 输 出 格式 
| 指令 、 上 下 文 (价值观 定 义 + 包含 标准 +7 个 正 例 +6 个 负 
IPFE) 网 )、 输 入 内 容 、 输 出 格式 
正 反 样本 比 p 指令 、 上 下 文 〈 价 值 观 定义 + 包含 标准 +6 个 正 例 +6 个 负 
fi AGS) I). MAKA, th 
; 指令 、 上 下 文 (价值观 定 义 + 包 含 标准 +7 个 正 例 +7 个 负 
QE 网 )、 输 入 内 容 、 输 出 格式 
| 指令 、 上 下 文 〈 价 值 观 定义 + 包含 标准 +7 个 正 例 +8 个 负 
IPFE (6 H8) 网 )、 输 入 内 容 、 输 出 格式 
指令 、 上 上 下文 (价值 观 定义 + 包含 标准 +7 个 正 例 16 个 负 
| 网 )、 输 入 内 容 、 输 出 格式 
少 样本 (716.)+ 。 指令、 上下文 《角色 赋予 + 价值 观 定义 + 包含 标准 +7 个 正 
角色 扮演 例 +6 个 负 例 )、 输 入 内 容 、 输 出 格式 
指令 、 上 下 文 《价值观 定 义 + 包含 标准 +6 个 正 例 +6 个 负 
少 样本 (6+6-) " Vise de 
ETN 例 )、 输 入 内 容 、 输 出 格式 
少 样 林 (6r6JH 。 指令 、 上 下文 (角色 赋予 + 价值 观 定义 + 包含 标准 17 个 正 
角色 扮演 例 +6 个 负 例 )、 输 入 内 容 、 输 出 格式 
l 指令 、 上 下 文 〈 价 值 观 定义 + 包含 标准 +6 个 正 例 +7 个 负 
少 样本 (647-) Mer SE 
例 )、 输 入 内 容 、 输 出 格式 


少 样本 (617-)+ 指令、 上 下 文 (角色 赋予 + 价值 观 定义 + 包含 标准 16 个 正 


角色 扮演 


例 +7 个 负 例 )、 输 入 内 容 、 输 出 格式 


注 : n+ 代表 有 nm 个 正 例 ，n- 代 表 有 mn 个 反例 ;“ 正 例 ” 代 表 体现 了 该 价值 观 的 样 例 ,“ 负 


Bl? RAZA ABZ PME LHI 


成 就 价值 观 、 权 力 价 值 观 、 博 爱 价 值 观 和 仁爱 价值 观 大 型 语言 模型 的 测试 数据 均 来 自 


RE 


T VEIN 手册 中 已 编 码 的 400 条 个 人 奋斗 。 针 对 每 个 价值 观 从 中 选取 100 条 已 标注 个 人 奉 
斗 ， 其 中 50 条 为 体现 了 该 价值 观 的 个 人 奋斗 《标注 为 1)， 另 外 50 条 则 是 未 体现 该 价值 观 


道德 个 人 奋斗 (标注 为 0)。 由 


于 这 些 模 


型 在 研究 二 中 将 被 应 用 于 识别 中 文 个 人 奋斗 ， 因 此 


本 研究 将 每 个 价值 观 的 所 有 的 测试 数据 均 翻 译 成 中 文 ， 以 评估 大 型 语言 模型 在 中 文 个 人 奉 


斗 上 的 识别 效果 。 


针对 每 个 价值 观 ， 在 每 个 设 定 的 实验 条 件 下 完成 对 测试 数据 集 的 判定 (是 否 体 现 该 价 
值 观 )， 根 据 每 条 个 人 奋斗 的 判定 结果 “0/1〉 以 及 实际 编码 结果 0/1) PETIA ERE JE 
清和 矩阵 是 一 个 方 阵 ， 其 中 行 表示 实际 类 别 ， 列 表示 预测 类 别 ， 将 整个 方 阵 分 为 四 个 象限 : 


真正 例 (True Positive, TP)， 即 模型 判定 结果 为 1， 实际 编码 也 为 1 的 数量 ， 假 正 例 (False 


Positive, FP)， 即 模型 判定 结果 为 1， 但 实际 编码 为 0 的 数量 ， 真 负 例 (True Negative, TN), 


即 模型 判定 结果 为 0， 实 际 编码 也 为 0 的 数量 ， 假 负 例 (False Negative, FN)， 即 模型 判定 


结果 为 0， 但 实际 编码 为 1 的 
率 、 精 确 率 、 召 回 率 。 


数量 。 基 


于 混 清和 矩阵 根据 如 下 公式 计算 大 型 语言 模型 的 准确 


准确 率 (Accuracy) ”模型 正确 预测 的 实例 ( 正 例 和 负 例 ) 占 总 实例 的 比例 。 


例 的 比例 。 


召回 率 (Recall) FS IE 


TP+TN 


Accuracy = 一 一 一 一 一 一 一 一 (4-1) 
TP+TN+FP+FN 
精确 率 (Precision) 模型 正确 预测 为 正 例 的 实例 占 所 有 预测 为 正 例 的 实 
Precision = Ut a (4-2) 
TP + FP 
外 预测 为 正 例 的 实例 占 所 有 实际 正 例 的 比例 。 
Recall = ERU (4-3) 
TP + FN 


2.2 研究 结果 


如 表 2-2 所 示 ， 大 型 语言 模型 对 权力 价值 观 、 成 就 价值 观 、 博 爱 价值 观 和 仁爱 价值 观 
的 识别 准确 率 都 达到 了 0.80 及 以 上 ， 这 展示 了 大 型 语言 模型 在 复杂 人 文 数据 标注 中 的 应 用 


潜力 。 需 要 注意 的 是 ， 针 对 不 同 价值 观 其 适用 的 提示 技术 有 所 不 同 。 和 针对 大 型 语言 模型 对 
权力 价值 观 、 博 爱 价 值 观 以 及 仁爱 价值 观 的 识别 ， 其 精确 率 与 召回 率 较为 平衡 ， 且 都 达到 
了 0.8， 这 说 明了 这 些 价值 观 模型 在 正确 


识别 正 例 的 同时 ， 几 乎 以 相同 的 比例 避免 遗漏 正 类 


实例 。 相 较 而 言 ， 大 型 语言 模型 对 成 就 价值 观 的 识别 则 展现 出 了 较 高 的 精确 率 ， 但 较 低 的 


召回 率 ， 这 意味 着 模型 在 预测 正 类 时 非 


常 谨慎 和 准确 ， 只 在 非常 确定 的 情况 下 才 将 实例 分 


类 为 正 类 ， 使 得 模型 在 预测 正 例 时 往往 是 正确 的 ， 但 却 遗 漏 了 一 部 分 本 该 被 判定 为 正 例 的 


实例 。 


表 1-2 ”四 种 价值 观 模型 识别 准确 率 及 相应 的 提示 技术 
价值 观 提示 技术 准确 率 ”精确 率 HEX 
权力 少 样本 (6+7-)+ 角色 扮演 0.89 0.90 0.88 
成 就 少 样本 (6+) 0.80 0.92 0.66 
博爱 零 样本 0.81 0.82 0.80 
仁爱 零 样本 0.87 0.80 0.98 


YE: n+ 代表 有 n 


表 2-3 显示 了 在 采 
现 零 样本 条 件 下 ChatGPT 具有 较 


个 正 例 ，n- 代 表 有 n 个 反例 ;“ 正 人 
例 "代表 未 体现 该 价值 观 的 样 


Ey 
Eu 

= 
o 


但 同时 也 将 大 量 的 非 


KARL FH, 
目标 样本 错误 地 识别 为 正 检 


上 大 多 数 或 所 有 


由 代表 体现 了 该 价值 观 的 样 例 ，“ 负 


不 同 提示 技术 时 大 型 语言 模型 对 权力 价值 观 的 识别 能 力 。 我 们 发 


模型 能 够 识别 


的 正 样本 ， 


本 。 而 在 少 样本 情况 下 ， 随 


着 样本 数 


《不 论 正 负 样 本 ) 的 增加 ， 对 于 正 例 的 标注 都 会 变 得 愈加 严格 ， 进 而 导致 精确 率 提 升 和 


回 率 下 降 ， 使 模型 更 加 平衡 。 除 此 之 外 ， 
在 一 样 的 样本 总 数 条 


效果 并 不 保持 一 致 。 
样本 〈7+6-) 的 效果 ; 而 少 样本 (8+6-) 却 在 准确 
外 ， 我 们 还 发 现 角 色 扮 演 这 一 提示 技术 整体 上 能 够 较 好 地 提升 权力 价值 观 模型 


体 来 说 ， 少 样本 (67 的 识别 准 
率 与 召回 率 上 都 优 于 少 样本 


通过 对 比 不 同 正 反 相 
牛 下 ， 正 反 样本 的 具体 比例 对 模型 的 准确 妆 


zu 


EE 
率 、 


例 下 的 识别 表现 ， 即 
精确 率 和 召回 率 的 影 


角 率 、 精 确 


oz 
E EN 


召回 


率 都 优 于 
(6+8-)。 
的 识别 效 


GPT3.5-Turbo 在 各 实验 条 件 下 对 权力 价值 观 的 识别 效果 


里 


f 


使 
ie 


少 


FH. 
AN o 


实验 变量 实验 条 件 准确 率 精确 率 召回 率 
零 样本 0.80 0.60 1.00 
少 样本 (6+) 0.80 0.92 0.66 
NUUS 少 样本 (6-) 0.69 0.66 0.80 
少 样本 (6+6-) 0.82 0.82 0.82 
少 样本 (8+6-) 0.84 0.90 0.76 
LA 少 样本 (7+6-) 0.80 0.85 0.72 
es 少 样本 (6+6-) 0.82 0.82 0.82 
少 样本 (6+7-) 0.85 0.91 0.78 
少 样本 (6+8-) 0.81 0.92 0.68 
少 样本 (7+6-) 0.80 0.85 0.72 
少 样本 (7+6-)+ 角 色 扮 演 0.83 0.88 0.76 
少 样本 (6+6-) 0.82 0.82 0.82 
Be 少 样本 (6+6-)+ 角 色 扮 演 0.82 0.88 0.74 
少 样本 (6+7-) 0.85 0.91 0.78 
少 样本 (6+7-)+ 角 色 扮 演 0.89 0.90 0.88 

YE: n+ 代表 有 mn 个 正 例 ，n- 代 表 有 mn 个 反例 ;“ 正 例 ” 代 表 体 现 了 该 价值 观 的 样 例 , “ 负 


例 ” 代 表 未 体现 该 价值 观 的 样 例 。 


2.3 讨论 


EN 


爱 价 


究 尝 试 使 朋 


我 人 


潜力 。 


H GPT3.5-Turbo 大 型 语言 模型 对 个 人 奋斗 列表 中 权力 、 成 就 、 博 爱 和 仁 
值 观 进行 识别 。 研 究 结 果 显示 ， 不 同 价值 观 的 识别 准确 率 均 不 低 于 0.80， 表 明 大 型 语 
言 模 型 在 复杂 文本 数据 标注 和 分 析 中 具有 应 
以 权力 价值 观 为 对 象 ， 设 置 了 不 同 实验 条 件 进 行 实验 ， 探 讨 样本 数 
比例 以 及 角色 扮演 三 个 变量 对 识别 效果 的 影响 。 针 对 样本 数 


HE. 
FH 


、 正 反 样 本 
我 们 发 现 增加 样本 数 


Ex 


里 ， 


HE. 
FH 


《无 论 是 正 样本 还 是 反 样 本 ) 可 以 提供 更 多 的 信息 ， 帮 助 大 型 语言 模型 更 准确 地 学 习 和 区 
分 个 人 奋斗 中 是 否 包 含 权 力 价值 观 ， 模 型 在 预测 时 变 得 更 加 谨 愤 ， 提 高 了 精确 率 ， 降 低 了 
召回 率 ， 使 得 模型 的 识别 效果 整体 更 加 平衡 。 因 此 ， 未 来 研究 可 以 尝试 通过 增 减 学 习 样 本 
数量 ， 针 对 特定 的 识别 任务 优化 大 型 语言 模型 的 表现 。 对 于 那些 “宁可 错 判 一 百 ， 也 不 放 过 
一 个 ”的 任务 ， 研 究 者 可 以 尝试 增加 样本 量 以 提高 模型 的 敏感 性 ， 即 便 这 可 能 会 牺牲 一 定 的 
精确 率 。 这 种 方法 可 能 特别 适用 于 高 风险 领域 ， 如 安全 监测 或 疾病 诊断 ， 其 中 快速 识别 潜 


人 奋斗 价值 观 的 识别 准 


二 分 类 任务 时 ， 


在 的 正 例 远 比 避免 误 判 更 为 重要 。 
对 于 ChatGPT 的 识别 效 
正 负 样 本 比例 可 以 帮助 ChatGPT 更 有 效 地 学 习 价值 观 在 个 人 奋斗 中 的 表现 ， 提 高 模型 对 个 


全 


性 、 精 确 


HY Sei 


设置 ， 


发 现 当 在 提示 


ATER 


除 此 之 外 ， 我 们 的 研究 还 发 现 正 反 样 本 比例 〈 即 偏 样本 ) 
果 也 有 影响 ， 这 一 点 在 以 往 的 研究 中 较 少 被 提 及 。 结 果 表明 适当 的 


EURAX., RKE 
PAA A TOL PA EE REAR, AFRE Ee H E 
进而 提高 模型 的 识别 效果 。 针 对 角色 扮演 ， 与 以 往 研 究 一 致 (Kong et al., 2023), Ri 


模拟 特定 的 角色 或 情境 ，ChatGPT 或 许 能 更 深入 地 理解 


此 外 ， 研 


观 和 成 就 价值 观 都 是 在 少 样本 的 情况 下 表现 
条 件 下 表现 得 比较 好 。 这 提示 我 们 在 实际 应 ) 


示 技 术 。 
研究 发 现 


究 还 发 现 ， 


， 大 型 


此 ， 在 研究 二 


究 者 在 训练 ChatGPT 完成 类 似 的 
jl 


] 


L^ 
U 


加 入 角色 扮演 元 素 时 ， 模 型 对 权力 价值 观 识别 效果 有 所 提升 。 这 表明 通过 


和 分 析 文 本 中 的 价值 观 。 


对 于 不 同 的 价值 观 ， 适 合 的 提示 技术 有 所 差异 ， 例 如 ， 权 力 价 值 


> 


EL 
AE 


J 语言 模型 在 一 定 程 度 上 能 够 胜任 个 人 奋斗 文本 的 价值 观 编码 工 
， 我 们 将 上 述 训 练 好 的 大 型 语言 模型 应 
作 中 ， 识 别 每 一 条 个 人 奋斗 当中 


租 更 好 ， 而 博爱 和 仁爱 价值 观 则 是 在 零 样 本 的 
j 中 需要 根据 识别 任务 的 差异 来 选择 合适 的 提 


= 


5 EA] 
在 个 人 奋斗 列表 的 价值 观 编码 工 


否 存 在 成 就 /权力 /博爱 /仁爱 价值 观 。 


3 研究 二 中 庸 思维 对 心理 健康 的 影响 机 制 研究 一 一 道德 中 心性 的 中 介 作 用 


3.1 研究 假设 


ayaa 


响 中 起 到 了 中 介 作 用 ， 
道德 中 心性 负 
心性 也 越 高 ， 抑 郁 水 平 越 低 ; 


Hl: 


p 


其 道德 


究 的 基础 


向 中 介 中 庸 思 名 


上 ， 本 研究 认为 道德 
体 研究 假设 如 下 : 


德 中 心性 在 
MES 


中 庸 思 


维 对 个 体 抑郁 /焦虑 水 平 的 影 


的 预测 ， 即 中 良 


思维 越 高 的 个 体 ， 


H2: 


NM 


道德 中 心性 负 向 中 介 中 庸 思 


其 道德 中 心性 也 越 高 ， 焦 虑 水 平 越 低 。 
3.2 研究 方法 
本 研究 共 邀 请 了 150 位 被 试 参与 研究 ， 其 中 男性 74 人， 女性 76 X, 


参考 Hoaglin 等 人 (2000) 提 出 的 作答 时 间 标 准 ， 根 和 


平均 年 龄 22.1 


任 对 个 体 焦虑 水 平 的 预测 ， 即 中 庸 思维 越 高 的 个 体 ， 


6. 


WA 5-1， 本 研究 以 作答 时 间 的 中 位 数 


(Quo) 减 去 1.5 倍 的 中 位 数 〈Q.so) 与 下 四 分 位 数 〈Q2s) 的 差 值 作为 作答 时 间 的 下 限 


《1881s)， 剔 除 不 满足 作答 时 间 下 限 的 被 试 后 剩余 121 位 参与 者 ， 其 中 ! 


人 人， 平均 年 龄 22.17。 


MUM FI = Q so — (1.5 X (Qso — Q23)) 


ASA 


性 62 A, AH 


E 59 


(5-1) 


完 采 用 中 庸 思 维 量 表 (Zhong-yong Thinking Style Scale, REX & 林 以 正 , 2005). 


流 调 中 心 抑郁 量 表 (Center for Epidemiological Studies Depression Scale , CES-D; Radloff, 1977)、 


状态 -特质 焦虑 量 表 CState-Trait Anxiety Inventory,STAI; Spielberger 等 , 2020) 测 量 个 体 的 ! 
思维 水 平 、 抑 郁 水 平和 焦虑 水 平 。 同 时 邀请 被 试 以 “我 试图 /努力 ”作为 句 首 ,填写 至 少 15 条 


Lj 


A AGE Ceg, RARR RAKE) 用 于 后 续 计 算 个 体 的 道德 中 心性 水 平 。 在 吻 


除 那些 填写 不 完整 的 个 人 奋斗 陈述 之 后 ， 我 们 最 终 获得 了 每 位 参与 者 平均 14.94 条 有 效 的 个 
人 奋斗 记录 。 


中 庸 思 维 量 表 (Zhong-yong Thinking Style Scale) ARA 


EJ & 林 以 正 (2005) 开 发 ， 


常 


被 用 于 衡量 个 体 的 中 庸 思 维 水 平 。 此 量 表 由 13 条 项 目 组 成 ， 每 一 条 项 目 代表 一 个 假设 性 的 
意见 表达 情境 ， 被 试 需要 评估 他 们 在 这 些 情境 中 的 思维 过 程 ， 并 进行 7 点 评分 ，1 代表 非常 


不 符合 ， 


7 代表 非常 符合 ， 分 数 越 高 代表 越 符 合 项 目 中 提 到 的 思维 过 程 。 


实例 :“' 我 会 试 着 在 意见 争执 的 场合 中 ， 找 出 让 大 家 都 能 够 接受 的 意见 ” 


附录 。 最 后 ， 根 据 各 项 得 分 计算 平均 分 即 可 获得 个 体 的 ， 
间 ， 分 数 越 高 代表 个 体 的 中 庸 思 维 水 平 越 高 。 该 量 表 在 中 国人 群 中 广泛 使 朋 
良好 的 信 度 和 效 度 (Sun 等 , 2014; Zhou & Li, 2022)， 本 研究 该 量 表 的 内 在 一 致 全 


(Cronbach’s alpha) 7j 0.83. 


流 调 中 心 抑 郁 量 表 (Center for Epidemiological Studies Depression Scale) CES-D 量 


Ls ae 


H, Jte 
ER 


以 下 是 一 些 项 目 
» HARA YS 


庸 思维 得 分 ， 得 分 范围 在 1-7 之 


由 美国 国家 公共 卫生 院 的 流行 病 学 中 心 在 20 世纪 70 年 代 开发 (Radloff, 1977), SEH FA 
型 流行 病 学 研究 中 快速 第 查 抑郁 症状 。 此 量 表 包 含 20 个 条 目 ， 每 个 条 目 代表 了 一 个 特定 的 
h 郁 症状 或 情感 状态 ， 如 翡 伤 、 失 望 、 睡 眠 障碍 、 食 欲 改变 、 集 
FE 活 乐趣 减少 等 。 参 与 者 需要 根据 自己 过 去 一 周 的 体验 ， 对 每 个 条 目 进 行 评 分 ， 评 分 标准 
如 下 : 0 分 -很 少 或 者 根本 没有 〔 少 于 一 天 )，1 分 : AN- (1-2 天 )，2 分 -经 常 (3-4 天 )，3 


注意 力 困难 、 自 我 贬低 、 


分 -大 部 分 或 全 部 时 间 (5-7 天 )。CES-D 量 表 的 总 分 范围 从 0 到 60 分 。 根 据 得 分 ， 可 以 将 
个 体 的 抑郁 症状 严重 程度 分 类 为 无 抑郁 (0-15 分 )、 轻 度 抑郁 (16-20 分 )、 中 度 抑郁 (21- 


25 分 ) 


度 已 经 得 到 了 充分 的 验 记 


或 重度 抑郁 (26-60 分 )。 由 于 其 广泛 的 使 ) 
E(Beekman et al., 1997; Jiang et al., 2019)， 本 研究 中 该 量 表 的 内 在 一 


致 性 系数 CCronbach's alpha) 为 0.93。 


状态 -特质 焦虑 量 表 (State-Trait Anxiety Inventory, STAI) 广泛 应 用 于 评估 个 体 焦 处 


水 平 的 心理 测评 工 


Anxiety) 和 “特质 焦虑 ”(Trait Anxiety〉 两 种 不 同 的 焦虑 。 本 而 
量 个 体 的 焦虑 水 平 ， 以 便 考 察 中 庸 思 维 是 如 何 通过 道德 中 心性 影响 个 体 在 面 对 压 力 时 所 表 
现 的 相对 稳定 的 焦虑 倾向 性 。 特 质 久 
1 分 代表 “几乎 不 ”，4 分 代表 “几乎 


J, CES-D 量 表 在 不 同 群 


体 上 的 信和 度 和 效 


i. XX EXE EH Spielberger 等 人 (2020) 开 发 ， 包 含 “状态 焦虑 ”(State 


究 选 择 了 特质 焦虑 量 表 来 稀 


虑 量 表 包含 了 20 个 项 目 


， 每 一 项 都 需要 进行 4 点 评分 ， 


p4 EL 
总 是 ”， 其 


的 得 分 进行 平均 后 民 


大 部 分 题目 


为 


正 向 计 分 题 ， 比 如 “我 通常 感到 


通过 正 


部 分 题目 为 反 计 分 题 ， 


比如 “我 经 常 感到 满 


向 计算 正 向 计 分 题 得 分 ， 反 向 计算 反 向 计 分 题 


可 获得 个 体 的 特质 焦虑 程度 。STAI 是 一 个 经 


害怕 ”， 评 分 越 高 ， 代 表 焦 虑 水 平 越 强 ; 还 有 
足 ”， 评 分 越 低 ， 代 表 焦 虑 水 平 越 强 。 

得 分 ， 然 后 对 20 条 项 目 

过 良好 验证 的 

2011), AHF! 


有 具 ， 在 不 同 的 样本 上 表现 出 了 较 高 的 信和 度 和 效 度 (Shek, 1988; Vitasari et al., 
该 量 表 的 内 在 一 致 性 系数 (Cronbach’s alpha) W 0.92. 


我 们 将 每 位 被 试 的 个 人 奋斗 列表 输入 到 研究 一 训练 的 4 个 价值 观 识别 模型 当中 ， 针 对 


被 试 填写 的 每 条 个 人 奋斗 ， 模 型 都 会 输出 
中 权力 /成 就 其 中 外 


如 前 所 述 ， 若 包含 其 
若 包 含 博爱 /仁爱 其 


德 中 心性 MCD 计算 方式 如 下 : 


其 中 : 


Mac 代 表 同 时 具有 能 动 和 


Na 代表 仪 具有 能 动 动机 的 个 人 奋斗 数量 。 
Ne 代表 仪 具有 共生 动机 的 个 人 奋斗 数量 。 


3.3 研究 结果 


表 3-1 显示 fn 


究 样 本 在 中 庸 思维 、 


道德 中 心性 、 


_ Nac 
MCI = M+ Nc x 100 
生动 机 的 个 人 奋斗 数量 。 


以 看 出 研究 样本 在 4 个 心理 指标 上 从 低 到 高 外 有 分 布 。 
上 的 得 分 高 于 5， 处 于 中 等 人 
KT 4。 可 以 看 出 ，: 


究 样 本 在 中 庸 思维 
平 的 样本 ， 其 得 分 


该 


维 模 式 ， 但 随 着 个 体 成 长 环境 的 不 同 ， 
究 样本 平均 有 超过 1/2 的 个 人 大 


抑郁 、 焦 虑 上 得 分 的 分 布 情况 ， 可 


针对 


庸 思维 ， 至 少 存在 7599] 


3L 


庸 作为 中 
其 影响 程度 也 有 所 差别 。 在 道德 中 心性 的 分 布 上 ， 
同时 融合 了 能 动 动机 与 


贿 上 水 平 ， 但 依然 有 少 音 


是 否 存在 该 价值 观 的 判别 结果 0- 不 存在 /1- 存 在 )。 
E 意 一 种 价值 观 ， 则 认为 该 个 人 奋斗 体现 了 能 动 动机 ; 


中 任意 一 种 价值 观 ， 则 认为 该 个 人 奋斗 体现 了 共生 动机 。 每 位 被 试 的 道 


(5-2) 


分 处 于 


等 偏 下 水 


Me Bt MLZ 


， 确 


生动 机 ， 而 


实 塑 造 着 个 体 的 思 


Hoyda 等 人 


(2020) 的 研究 显示 西方 样本 群体 平均 只 有 26% 左 右 的 个 人 奋斗 会 同时 体现 两 种 动机 ， 这 或 


许 与 东西 方 文化 差异 有 关 。 针 对 抑郁 与 焦虑 而 言 ， 大 部 分 月 


轻微 症状 )， 但 也 有 少 部 分 用 


”表现 出 较为 严重 的 抑郁 /焦虑 水 平 。 


昌 户 处 于 较 低 水 平 (无 显著 症状 / 


表 3-3 心理 指标 描述 性 统计 结果 


心理 指标 中 庸 思维 道德 中 心性 抑郁 焦虑 
人 数 121 121 121 121 
均值 5.71 57.54 12.33 1.76 
标准 差 0.61 13.00 9.53 0.51 
最 小 值 2.77 21.43 0 0.95 
最 大 值 6.85 87.67 39.00 3.10 
Qos 5.38 50.00 5.00 1.38 
Q.so 5.77 53.85 9.00 1.67 
Qs 6.08 64.29 19.00 2.14 


YE: Qos tA 25 百 分 位 数 ， 表 示 有 25% 的 人 的 得 分 小 
分 位 数 ， 表 示 有 50% 的 人 


75% 的 人 的 得 分 小 于 此 测量 值 。 


FARA TAA, PRR 
«010 呈 负 向 预测 关系 ， 而 与 个 体 


体 的 道德 : 


iE 


的 道德 ! 


F 此 测量 值 ;， Qso 代 表 第 50 E 


的 得 分 小 于 此 测量 值 ，Q.7s 代 表 第 75 百 分 位 数 ， 表 示 有 


住 与 个 体 的 抑郁 Cr = -0.19, p <.05) 和 焦虑 Cr = -0.24, p 
心性 水 平 正 向 关联 (r= 0.27,p <.01)。 此 外 ,个 
心性 水 平 与 抑郁 (r= -0.31, p <.01) 和 焦虑 (r= -0.32, p <.01) 表现 出 显著 的 负 


相关 ， 这 些 发 现 均 与 研究 假设 一 致 。 进 一 步 分 析 表 3-2 的 数据 可 见 ， 道 德 中 心性 与 抑郁 / 焦 


Iu 


抑郁 


道德 中 心性 


- 


抑郁 

1.00 
0.88" 
-0.31™ 
-0.19* 


表 3-4 相关 分 析 结 果 


Be HE 
As PUN 


1.00 


虑 的 相关 性 均 高 于 中 庸 思维 与 抑郁 /焦虑 之 间 的 相关 性 ， 这 进一步 强调 了 道德 中 心性 与 抑郁 
/焦虑 之 间 紧 密 的 联系 。 


中 良 思 维 | 


» 
YE: 
: 


析 结 果 。 从 : 


中 , 道德 中 心性 


在 中 庸 思维 与 


了 部 分 中 介 作 用 。 这 些 结果 都 显示 了 中 庸 思维 
虑 水 平 ， 维 护 个体 心 理 健康 。 


“代表 ps.01, “(RK p<.05。 
通过 RR 语言 的 mediation 包 进 行 中 介 分 析 ， 表 3-3 和 表 3-4 AHS 


可 以 看 出 ， 中 庸 思维 通过 道德 中 心性 显著 地 影响 个 体 的 抑郁 和 焦虑 水 平 。 
抑郁 之 间 起 到 了 完全 中 介 作 用 ， 在 中 良 


会 通过 提高 道德 中 心性 降低 个 体 


表 3-5 以 抑郁 为 因 变 量 的 中 介 分 析 结 果 


AN f FAB ALAR RE oY 


N 


思维 与 焦虑 之 间 起 到 
抑郁 和 焦 


Estimate 95% CI Lower 95% CI Upper p-value 

间接 效应 -0.0591 -0.1193 -0.0100 0.0060 
直接 效应 -0.0850 -0.2203 0.0400 0.2400 
总 效应 -0.1441 -0.2888 -0.0100 0.0420 


X 3-6 以 焦虑 为 因 变 量 的 中 介 分 析 结 果 


Estimate 


95% C 


I Lower 


95% CI Upper 


p-value 


间接 效应 
直接 效应 


总 效应 


-0.0023 
-0.1481 
-0.2104 


3. 讨论 


-0.1257 
-0.2908 
-0.3582 


本 研究 运用 了 最 新 的 大 型 


语言 模型 工 


H 


ZzN? 


-0.0200 
-0.0100 
-0.0700 


0.0020 
0.0380 
0.0060 


在 个 体 层面 考察 了 ， 


唐 思 维 与 特质 焦虑 、 抑 


郁 之 间 的 关系 以 及 道德 中 心性 
中 庸 思维 会 通过 道德 中 心性 
平 负 向 预测 个 体 焦虑 和 


IA 
H2 


HARKE; Gi) 
道德 中 心性 水 平 负 问 预测 个 体 焦 处 和 


的 中 介 作 
啊 个 体 上 


R 


用 。 研 究 结果 显示 ， 道 德 中 心性 的 ， 
焦虑 和 抑郁 水 平 ， 具 体 模 式 如 下 : GAA 
FE 正 向 预测 个 体 道 德 中 心 和 


有 思维 水 


ifi 


健康 机 制 的 认识 ， 为 如 何 利用 
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里 公共 利益 和 个 人 利益 的 关系 时 ， 
味 着 要 求 个 人 完全 放弃 自己 的 利益 ( 李 问 辉 , 2012). KEE, fit Ae 


利益 并 非 总 是 对 立 的 ， 个 人 的 福 社 与 社会 的 和 谐 是 相互 依存 的 ， 一 个 稳定 逢 
了 成 长 和 实现 自我 价值 的 舞台 ， 而 个 人 通过 贡献 自己 的 力量 能 促进 社会 福 社 ， 
会 发 展 的 成 果 ( 高 晓 红 , 2006)。 可 以 
个 人 利益 与 公共 利益 的 相互 促进 ， 


为 个 人 提供 
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里 念 上 不 谋 而 合 。 我 们 的 
更 好 地 协 i 
当 个 体能 在 个 人 利益 和 神 


与 Fri 


水平 。 


传统 文 


— 
AZN o 


中 国 


化 


纲 拓 宽 了 我 们 对 中 局 
的 思想 和 到 


介 作 用 存在 ， 
思维 水 
EKF; Gii) 

和 思维 影响 心理 


E 念 来 设计 和 实施 教 


EF 


则 中 展现 了 其 关于 
考虑 


六 个 人 与 社会 关系 的 思 
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[ 谐 的 社会 环境 
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mer 和 Walker (20 
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研究 ! 


周 个 人 利益 与 公共 利益 之 间 的 关系 ， 并 往生 
[会 利益 之 间 寻 找到 平衡 点 时 ， 将 个 人 利益 视 为 实现 他 人 / 社 


会 利益 的 途径 时 ， 能 够 有 效 地 


的 文化 环境 中 ， 个 人 往往 被 鼓励 将 群体 的 福 社 放 在 自己 的 利益 之 上 ( 陈 桐 生 ,， 1999). PEG 
标 和 利益 ， 在 行为 上 被 视 为 与 群体 规范 不 一 致 时 ， 往 
FÆ (Hornsey et al., 2006)。 相 反 的 情况 ， 如 果 个 体 一 味 为 了 迎合 
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中 国 


F， 使 得 对 自我 价值 的 感知 来 


E 护 个 体 的 心理 健 有 
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步 提升 个 体 的 自我 效能 感 与 自尊 (Lonngqvist et al., 2009; 


[会 之 间 形 成 一 种 积极 的 互动 关系 ， 降 低 个 体 ! 
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体 
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HX» Hi 


4 总 讨论 


本 系列 研究 深入 探讨 了 中 庸 思 维 对 心理 健康 的 影响 ， 重 点 分 析 了 道德 中 心性 的 中 介 作 


， 并 利用 大 型 语言 


模型 、 社 交 媒 体 大 数据 等 新 兴工 具 ， 开 展 了 一 系列 实证 研究 。 研 究 


揭示 了 大 型 语言 模型 在 心理 标注 中 的 应 用 潜力 ， 特 别 是 ChatGPT 在 以 可 接受 的 准确 率 识别 


个 体 文本 中 的 成 就 、 权 力 、 博 爱 、 仁 爱 价值 观 方面 的 能 力 。 研 究 二 利用 研究 一 训练 的 大 型 


语言 模型 辅助 完成 个 


中 心性 ， 进 而 降低 个 体 的 抑郁 和 焦虑 水 平 。 本 系列 研究 不 仅 揭 示 了 中 庸 思维 通过 道德 中 心 


性 


这 一 路 径 作用 于 个 


潜力 。 这 些 研究 为 理 


研究 一 通过 探索 


成 就 、 博 爱 、 仁 爱 ) 
本 数量 、 正 负 样 本 比 
尝试 针对 特定 的 识别 任务 ， 在 提示 词 中 设置 不 同 的 学 习 样 本 数量 以 及 类 型 ， 并 考虑 结合 
色 扮 演技 术 来 优化 大 型 语言 模型 的 识别 性 能 。 事 实 上 ， 现 在 有 越 来 越 多 的 提示 技术 被 发 现 


他 心理 学 研究 领域 


体 道 德 中 心性 的 测量 。 研 究 发 现 ， 中 庸 思 维 能 够 正 向 提升 个 体 的 道德 


体 心理 健康 的 潜在 机 制 ， 还 展示 了 大 型 语言 模型 在 心理 学 研究 中 的 应 
解 和 干预 个 体 心 理 健康 问题 提供 了 新 的 视角 和 方法 ， 同 时 也 为 心理 


研究 领域 引入 了 新 的 技术 手段 和 研究 思路 。 


GPT3.5-Turbo 大 型 语言 模型 在 识别 个 人 奋斗 列表 中 的 价值 观 ( 权 力 、 
的 能 力 ， 揭 示 了 大 型 语言 模型 处 理 复杂 文本 数据 的 潜力 ， 并 探讨 了 样 
例 、 及 角色 扮演 技术 对 权力 价值 观 识别 效果 的 影响 。 未 来 研究 者 可 以 


能 够 影响 大 型 语言 模型 的 任务 表现 《比如 思维 链 、 自 我 一 致 性 )， 未 来 的 研究 可 以 进一步 探 


索 这 些 提示 技术 对 于 提高 文本 价值 观 识别 


皇 务 的 影响 ， 以 及 大 型 语言 模型 及 提示 工程 在 其 


| 


ZS 
Tri. 


] 。 在 中 庸 思维 部 分 
焦虑 和 抑郁 水 平 ， 这 
能 够 通过 促进 个 体内 
现 不 仅 丰富 了 我 们 对 文化 因素 影响 心理 健康 机 制 的 认识 ， 也 为 如 何在 当今 心理 健康 状况 日 


的 应 用 潜力 。 


研究 二 分 析 中 良 


思维 与 心理 健康 之 间 的 关系 ， 揭 示 了 道德 中 心性 在 其 中 发 挥 的 中 介 作 


， 我 们 发 现 中 庸 思维 通过 提高 个 体 的 道德 中 心性 ， 有 效 降低 了 个 体 的 
一 发 现 强 调 了 中 庸 思 维 在 维护 个 体 心理 健康 中 的 积极 作用 。 中 庸 思维 
在 动机 的 和 谐 ， 提 升 个 体 的 道德 中 心性 ， 从 而 维护 心理 健康 。 这 些 发 


严峻 的 社会 环境 ， 


发 挥 文化 优势 以 维护 和 促进 心理 健康 提供 了 启示 。 事 实 上 ， 习 近乎 主 


席 在 十 二 届 全 国人 大 一 次 会 议 上 就 曾 讨论 过 个 人 梦 和 国家 梦 的 关系 ， 他 指出 青年 要 将 个 人 


H 


为 个 人 梦 的 实 


f 


之 间 的 关系 ， 促 进 民 
试 在 社会 上 倡导 此 类 
民众 更 好 地 平衡 个 人 

全 


的 局 限 ， 为 理解 文化 如 何 影响 心理 健康 提供 了 新 的 视角 。 这 些 技术 的 应 


究 一 定 程度 地 从 理 


想 紧密 联系 在 一 起 ， 青 年 要 在 投身 “中 国 梦 "的 伟大 实践 中 实现 “个 人 梦 "”， 其 中 "中国 梦 ” 
岗 提 供 了 强 有 力 的 人 舞台， 个 人 梦 的 实现 为 “中 国 梦 "的 实现 葛 定 基石 。 我 们 的 


论 上 证 实 了 此 类 价值 观 能 够 帮助 个 体 更 好 地 平衡 个 人 利益 与 公共 利益 


尽管 本 研究 结合 


众 的 精神 健康 与 社会 的 良性 发 展 ， 未 来 政策 制定 者 或 许可 以 更 多 地 党 

既 重 视 个 人 发 展 又 注重 集体 福 社 的 价值 观 ， 通 过 中 庸 思 维 教育 来 帮助 

与 集体 之 间 的 利益 ， 形 成 协调 的 思维 模式 。 

大 型 语言 模型 技术 ， 突 破 了 传统 方法 在 个 体 及 群体 道德 中 心性 测量 上 
用 不 仅 降 低 了 研究 


成 本 ， 提 高 了 效率 ， 还 为 未 来 的 相关 研究 指明 了 新 的 技术 路 径 。 但 是 该 研究 仍然 存在 一 些 
可 能 的 局 限 性 ， 总 结 


如 下 : 


首先 ， 尽 管 研 究 一 已 经 证 实 ChatGPT 可 以 高 效 地 帮助 研究 者 完成 个 人 奋斗 


的 价值 观 


识别 任务 ， 且 识别 准确 率 处 于 可 接受 水 平 ， 但 是 相 比 起 以 往 研究 中 人 工 标 注 的 89%-95% 的 


一 致 性 (Hoyda, 2020)， 依 然 有 进一步 的 优化 空 


闻 。 未 来 研究 者 可 以 尝试 通过 更 加 精细 化 的 


上 下 文 设 置 和 探索 多 样 的 提示 技术 来 提高 识别 效率 。 比 如 ,“ 改 变 他 人 的 认 知 /行为 /想法 "是 


权力 价值 观 的 包含 标准 之 一 ， 但 是 我 们 发 现 通过 像 VEIN 手册 中 一 样 ， 单 独 列 出 这 一 包含 


标准 让 ChatGPT 进行 学 习 时 ， 大 型 语言 模型 并 不 能 较为 准确 地 识别 出 客体 认 知 /行为 /想法 


改变 的 情况 ， 进 而 出 现 假 阴 性 的 错误 。 客 体 识 别 更 多 地 涉及 理解 句子 的 结构 ， 识 别 动作 的 
接收 者 或 受 影响 的 对 象 ， 在 一 定 程 度 上 提升 了 语义 复杂 度 ， 以 往 研究 表明 随 着 语义 复杂 度 
的 增加 ，ChatGPT 生成 不 准确 相应 的 概率 也 在 增加 (Dhar & Bose, 2024)。 针 对 此 类 特定 的 语 


言 特征 ， 未 来 研究 者 或 许可 以 尝试 更 精 台 


进而 提升 模型 的 识别 能 力 。 


化 的 指导 ， 并 结合 示例 来 降低 语句 的 语义 复杂 度 ， 


影响 了 研究 结果 的 外 推 性 和 普遍 有 效 性 


了 对 这 一 特定 人 群 心理 健康 潜在 影响 


, 


Lil 


Zn 


因为 


第 二 ， 本 研究 在 样本 选取 方面 存在 一 定 的 偏差 ， 具 体 体现 在 研究 二 以 本 科学 历 的 大 学 
生 参 与 者 为 主 ， 年 龄 跨度 在 18-30 岁 ， 平 均 年 龄 22.17， 属 于 年 轻 群 体 ， 这 种 抽样 偏差 可 能 
这 些 特定 的 群体 可 能 无 法 全 面 代表 更 广泛 的 
人 口 统计 特征 。 尽 管 本 研究 在 样本 选取 上 存在 偏向 年 轻 群 体 的 局 限 性 ， 它 仍然 为 我 们 提供 
的 深入 见解 。 未 来 研究 应 当 致 力 于 包含 更 广泛 的 


年 龄 段 和 不 同 背景 的 参与 者 ， 以 提高 


盖 的 社会 经 济 状态 、 教 育 水 平 、 文 化 背景 等 因 


九 


综 上 所 述 ， 虽 然 本 研究 在 数据 源 以 及 使 用 


等 局 限 性 ， 但 是 本 研究 不 仅 成 功 突 破 了 传统 研 


的 代表 性 和 结论 的 普遍 适用 1 
素 ， 提 升 结论 的 适用 性 与 鲁 棒 性 。 
的 技术 手段 上 存在 包括 样本 多 样 性 、 测 量 准 确 性 


= 


生 。 通 过 扩大 样本 履 


究 方法 的 限制 ， 为 探索 文化 对 心理 健康 影响 


的 复杂 机 制 提供 了 新 的 视角 和 方法 ， 同 时 也 为 心理 健康 领域 的 干预 措施 和 政策 制定 提供 了 


有 价值 的 见解 。 


5 总 结 


本 研究 聚焦 于 探讨 中 庸 思维 对 心理 健康 的 影响 机 制 ， 验 证 道德 中 心性 可 能 在 其 中 起 到 


的 中 介 作 用 。 在 此 过 程 中 ， 我 们 尝试 利用 了 大 型 语言 模型 技术 手段 克服 了 传统 心理 测量 过 


程 中 过 到 的 问题 。 研 究 结 论 如 下 : 


1) GPT3.5-Turbo 大 型 语言 模型 能 够 较为 准确 
在 识别 权力 、 成 就 、 博 爱 和 仁爱 价值 观 方面 的 准确 率 均 不 低 于 0.8， 未 来 研究 者 可 以 尝试 训 


练 大 型 语言 模型 来 完成 价值 观 的 标注 了 


inj 
qu] 


的 识别 个 人 奋斗 列表 中 存在 的 价值 观 ， 模 型 


[ 作 ， 减 少 人 工 编 码 负担 并 提高 数据 处 理 效率 ， 丰 富 


该 领域 的 研究 手段 。 


低 的 抑郁 /焦虑 水 平 。 
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